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摘要 : [ 目的/ 意义] 探索 微 博 与 情 传播 周期 中 不 同 传播 者 关注 的 与 情 热点 和 传播 内 容 的 主要 观点 ,进而 发 
现 与 情 传播 的 特点 和 规律 ,为 与 情 分 析 与 决策 提供 依据 。[ 方 法 /过 程 ] 以 特定 与 情事 件 的 事实 文本 数据 为 来 
源 ,以 生命 周期 理论 和 LDA 方法 为 指导 ,设计 研究 流程 与 构建 研究 模型 ,对 微 博 与 情事 件 中 不 同 传播 者 的 话题 
进行 主题 研究 ,其 中 包括 主题 抽取 和 结果 语义 标注 各 阶段 的 不 同 传播 者 主题 的 语义 分 析 \ 基 于 时 间 维 度 的 与 
情 主题 观点 识别 与 刻画 。[ 结果 /结论 ] 研究 发 现 ,论文 所 提出 的 研究 模型 能 够 挖 握 出 与 情 传播 周期 中 不 同 伟 
播 者 的 主题 结构 、 观 点 脉络 以 及 特征 ,研判 出 分 布 在 文字 当中 有 关联 性 的 、 代 表 性 的 、 重 要 的 词语 。 同 时 ,结论 
中 还 发 现 微 博 中 的 官 媒 、 大 众 媒体 发 布 信息 中 的 话题 和 用 户 谈论 的 热点 话题 具有 明显 的 差异 性 。 
二 关键 词 : 微 博 与 情 不同 传播 者 主题 挖 气 观点 识别 ”生命 周期 理论 LDA 主题 模型 
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传播 阶段 万 千 话 语 中 的 热点 主题 ,以 探索 时 间 维 度 下 

言 息 发布 者 与 信息 接收 者 的 两 类 不 同 传播 者 的 语言 特 
新 媒体 催生 出 社会 与 情 传播 形式 的 多 元 化 .传播 。” 征 和 表达 观点 。 

速度 的 瞬时 化 .传播 数量 的 海量 化 ,传播 内 容 的 高 度 分 

艇 玖 与 各 种 会 话 的 碎片 化 ,常常 使得 社会 事件 的 新 闻 

报道 在 发 布 与 评论 过 程 中 不 断 地 被 放大 或 者 被 扭曲 ， 根据 研究 的 需要 ,本 文 首先 对 熏 情 主题 研究 现状 

午 竺 造成 社会 与 情 事件 的 频 楷 爆发 。 其 中 ,以 微 博 为 。 的 相关 文献 加 以 综述 ;然后 ,再 对 研究 使 用 方法 和 理论 

代 震 的 新 媒体 ,不 仅 因 其 具有 的 匿名 性 、 自 由 性 等 特点 。 加 以 梳理 。 

使 狂 民 任性 表达 的 意愿 得 到 激发 ,而 且 由 于 交流 功能 。” 2,1 ” 奥 情 主题 研究 现状 

的 惩 捷 性 与 社交 性 使 得 传播 元 素 之 间 的 相互 作用 得 到 通过 文献 调研 ,国内 外 学 者 对 于 与 情 主题 的 研究 

彰显 。 经 由 微 博 发 布 的 与 情事 件 ,传播 后 产生 的 话题 。” 主要 从 奥 情 主题 挖掘 和 主题 监测 的 视角 进行 展开 。 在 

内 容 襄 贬 不 一 ,传播 者 交互 的 情感 和 态度 多 元 复杂 与 ”主题 挖掘 研究 中 常 应 用 自然 语言 处 理 .文本 聚 类 、 共 词 

影响 多 样 ,强化 了 与 情 传播 的 突 发 性 与 效应 性 ,增加 了 分析、 主题 建 模 ,算法 改进 等 技术 方法 。 在 主题 监测 层 

社会 不 稳定 因素 与 复杂 程度 ,加 大 了 公共 治理 的 难度 。 ，” 面 中 ,主要 从 主题 监测 追踪 、 预 警 等 研究 角度 进行 研 

那么 ,在 社会 时 情 传播 的 不 同 阶段 ,信息 发 布 后 ,经 过 究 。 

微 博 传 播 产 生 的 信息 评论 ,在 主题 内 容 上 是 如 何 发 展 在 主题 挖 据 研 究 方面 ,学 者 陈 晓 美 等 基于 LDA 主 

并 形成 哪些 表达 观点 ;同时 ,与 信息 发 布 主题 相 比 ,与 。 题 模型 观点 提取 方法 ,通过 对 比分 析 观 点 提取 方法 间 

情 评 论 主题 又 有 何 异 同 。 由 此 ,本 文 从 奥 情 监测 实时 的 差异 ,从 认 知 上 阐释 网 络 幅 论 平 台 的 群体 智慧 和 受 

性 的 视角 出 发 ,结合 生命 周期 理论 .LDA 模型 ,构建 一 众 个 体 的 认 知 过 程 ,最 后 发 现 LDA 主题 模型 提取 与 情 

种 有 效 地 动态 挖掘 与 情事 件 热 点 主题 的 分 析 模 型 ,并 ”观点 的 优势 及 新 路 径 "” "”。 张 寿 华 等 在 与 情 热 点 主题 研 

依据 研究 模型 追踪 与 情 传 播 内 容 , 挖 掘 出 隐藏 在 与 情 。 究 中 采用 了 TFIDF 法 ,话题 聚 类 算法 等 方法 ,研究 还 设 
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计 了 一 个 主题 挖掘 系统 ,并 通过 与 情 预 处 理 ,关键 词 提 
取 话题 聚 类 热点 话题 分 析 等 关键 环节 来 实现 ,研究 
发 现 所 设计 的 系统 对 网 络 与 情 热 点 有 较 高 的 识别 准确 
率 ”。 李 可 等 应 用 共 词 分 析 方 法 对 与 情 主题 进行 研 
究 ,并 在 研究 中 通过 构建 共 词 矩 阵 ,关键 词 共 现 找 出 热 


研究 进行 实证 ,研究 发 现 建 立 的 模型 有 很 好 的 挖掘 和 
监测 效果 以 及 潜在 的 应 用 价值 。 

综 上 所 述 ,与 情 主 题 研究 是 许多 研究 者 关注 的 内 
容 ,研究 数量 不 断 增加 ,并 形成 许多 有 价值 的 研究 成 果 
和 观点 。 根 据 上 述 研 究 还 可 知 , 关 于 网 络 与 情 的 主题 


点 话题 ,同时 研究 结果 表明 提出 的 研究 方法 不 仅 有 应 
用 价值 , 且 可 提高 对 网 络 与 情 信息 精炼 和 概括 的 效 
率 ”。 钱 爱 兵 应 用 如 主题 关注 热点 、 焦 点 等 与 情 信息 


挖掘 研究 多 基于 文本 挖 据 技 术 和 智能 算法 等 方法 来 实 
现 ;在 主题 挖掘 中 ,自然 语言 处 理 的 LDA 模型 ,特征 词 
抽取 等 方法 能 够 较 精准 的 揭示 语料库 的 词语 特征 、 适 


的 计量 方法 ,通过 构建 基于 主题 的 网 络 与 情 分 析 模 型 ， 
包括 :与 情 主题 规划 、 与 情 信 息 采 集 和 分 析 、 与 情 预 警 
等 ,得 到 与 情 主题 关注 、 热 点 .焦点 .重点 的 研究 结 
论 趾 。 梁 晓 贺 等 通过 网 络 计量 方法 ,在 研究 中 构建 用 
户 .观点 ,情感 ,时序 阶段 4 层 子 网 的 超 网 络 模型 ,并 将 
该 模型 结合 具体 案例 事件 进行 分 析 ,其 研究 结论 表明 ， 
基于 舆情 主题 发 现 的 超 网 络 模型 的 子 网 分 析 可 揭示 每 
层 子 网 的 特征 信息 , 超 边 分 析 可 用 于 与 情 预警 分 析 ` 司 


nf 


meags 聚 类 和 SVM 算法 对 文本 进行 挖 气 研 究 ,将 新 浪 
微 册 的 体育 论坛 进行 归 类 ,并 进行 文本 挖 气 , 研 究 结论 
控 医 出 基于 文本 数据 的 热门 话题 ,和 发 现 两 种 方法 的 
记 电 部 得 到 了 同样 的 结果 "。L. Y. F，Su 等 基于 HK 
算 淄 研究 与 情 主题 ,通过 智能 算法 改进 .内 容 分 析 , 对 
传 撕 主题 情感 进行 挖 握 , 结 果 发 现 该 研究 方法 对 社交 
媒 依 与 情 主题 挖掘 的 研究 具有 可 靠 性 和 有 效 人 性” 。 

< 在 与 情 主题 监测 研究 方面 , 丁 蝴 春 等 采用 了 网 络 
二 .网 页 预 处 理 正文 提取 等 技术 方法 ,通过 构建 针 
对 南海 问题 的 多 语种 与 情 监测 体系 ,并 实行 时 间 序列 
下 的 主题 追踪 ,研究 结论 表明 构建 的 与 情 监测 系统 能 
够 实现 舆情 信息 采集 \ 处 理 和 分 析 等 ” 。 张 瑜 等 基于 
巴 斯 模 型 ,通过 微 博文 本 分 词 . 阔 值 确定 、 微 博文 本 特 
征 提取 .议题 词典 构建 . 微 博文 本 议题 划分 等 文本 处 理 
步 怠 ,实现 对 微 博 热点 事件 内 部 不 同 主题 的 情感 随时 


据 及 与 情 主 题 演化 分 析 5 。N. Li 等 通过 KK- 


合 大 规模 数据 集 的 挖掘 研究 ;而 共 词 分 析 法 ,存在 词 频 
闵 值 的 不 确定 性 ;和 主题 词 的 社会 网 络 分 析 法 ,注重 词 
语 间 的 关联 性 ,适合 应 用 于 小 数据 集 的 分 析 ” ;文本 
聚 类 方法 中 的 标注 类 别 具 有 较 强 的 主观 性 ,也 比较 适 
合 少量 的 数据 研究 。 主 题 监 测 方面 大 多 数 研究 都 会 基 
于 时 间 动 态 视角 进行 追踪 研究 ,往往 涉及 到 生命 周期 
理论 ,时间 序列 等 理论 与 方法 ;在 技术 方法 上 涉及 到 
word2vec 技术 ,NB 算法 、TSM 模型 .统计 分 析 等 方法 ; 
通常 生命 周期 等 理论 通过 与 技术 方法 的 结合 应 用 来 展 
现 监测 主题 的 变化 、 变 异 等 形态 和 趋势 。 但 是 现今 与 
情 主题 监测 研究 中 ,大 多 数 缺乏 对 不 同性 质 主题 的 辩 
别 ,使 得 监测 主题 的 内 容 与 观点 散乱 .无 着 力 点 。 由 于 
本 文 的 研究 即将 进行 较 大 规模 数据 处 理 , 且 力求 发 现 
时 间 粒 下 的 不 同性 质 传播 者 与 情 主 题 的 内 容 和 观点 。 
所 以 ,本 文采 用 LDA 模型 方法 和 生命 周期 理论 ,以 两 
者 的 结合 应 用 为 指导 ,提出 研究 流程 和 研究 模型 ,以 揭 
示 网 络 与 情 发 展 的 规律 
2.2 研究 方法 

2.2.1 LDA 主题 模型 LDA 主题 词 挖 掘 是 自然 语言 
处 理 中 的 重要 挖掘 方法 ,也 是 一 种 完全 生产 式 的 模型 。 
LDA 主题 模型 可 以 展现 出 单个 主题 下 相关 词 项 的 集合 
及 概率 ,能 够 排除 主观 因素 对 于 科学 研究 的 影响 ,还 弥 
补 传统 研究 不 能 有 效 深 入 挖掘 大 批量 文本 的 局 限 。 由 
于 ,LDA 模型 在 国内 外 研究 中 的 应 用 已 相当 广泛 和 成 


oO 


间 分 布下 变化 与 发 展 趋势 的 研究 ,结果 发 现 了 不 同 话 
题 的 状态 .群体 情感 对 话题 的 影响 等 结果 ” 。 安 璐 等 
采用 了 生命 周期 理论 和 word2vec 技术 ,通过 对 主题 评 
论 情感 做 细 粒 度 划分 ,计算 情感 强度 ,最 终 实 现 微 博 主 
题 与 情感 的 协同 分 析 , 结 果 发 现 研 究 所 提出 的 分 析 方 
法 能 够 揭示 面向 特定 事件 的 微 博 网 络 与 情 主题 与 情感 
特征 的 协同 演化 规律 ”。J. Zhao 等 应 用 NB 算法 ,并 
通过 改进 算法 .定义 参数 ,对 与 情 非 常态 事件 进行 情感 
计量 ,研究 达到 了 时 间 序列 下 奥 情 监测 的 意义 ”"。Q. 
Mei 等 应 用 TSM 模型 对 微 博 主 题 进行 监测 ,通过 模型 
中 的 参数 定义 建立 研究 模型 ,再 应 用 生命 周期 划分 对 
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熟 , 人 研究 不 再 袭 述 。 

在 与 情 主 题 研 究 中 , 唐 晓 波 等 基于 LDA 模型 对 微 
博 热点 进行 挖掘 ,该 研究 构建 了 关于 微 博 热度 概念 的 
LDA 模型 ,然后 通过 采集 的 微 博 数 据 进行 实验 ,研究 结 
果 发 现 改进 的 LDA 模型 能 得 到 更 直观 的 微 博 热度 表 
和 更 具有 说 服 力 的 控 气 结论"” ; 林 萍 等 基于 LDA 模型 
抽取 话题 ,通过 后 离散 时 间 型 话题 模型 思路 分 析 话题 
热度 变化 ,和 先 离 散 时 间 型 话题 模型 思路 分 析 话 题 内 
容 迁移 ,人 研究 不 仅 发 现 奥 情事 件 话题 内 容 , 还 发 现 最 佳 
话题 数量 与 文本 内 容 焦 点 集中 度 密切 相关 等 结论 ; 
W. XZhao 等 采用 LDA 文本 挖掘 技术 ,对 Twitter 的 内 
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容 和 传统 媒体 纽约 时 报 进 行 同类 主题 的 挖掘 对 比 , 深 
和 探究 了 发 布 与 回复 博文 的 主题 和 类 别 之 间 的 关系 ， 
研究 还 发 现 线 下 和 线 上 的 异同 情况 ;M. Pennac- 
chiotti 等 采用 LDA 主题 模型 ,发 现 用 户 的 兴趣 ,最 终 研 
究 得 出 了 一 个 向 用 户 推荐 相似 兴趣 朋友 的 系统 。 
综 上 所 述 ,LDA 主题 模型 不 仅 是 与 情 主 题 分 析 的 一 种 
有 效 方法 ,也 是 学 者 们 倾向 采用 的 热点 技术 。 

2.2.2 生命 周期 理论 ”生命 周期 理论 能 够 很 好 的 揭 
示 事 物 从 诞生 .生长 成熟. 衰退 到 消亡 的 过 程 ,在 各 学 
科 领 域 都 得 到 了 广泛 的 应 用 。 在 网 络 僵 情 的 研究 中 ， 
一 般 将 信息 从 产生 到 失效 的 整个 经 历 过 程 定义 为 传播 
的 生命 周期 。 生 命 周 期 理论 作为 一 种 概念 理论 ,需要 
具体 的 环节 进行 支撑 ,其 应 用 相对 于 模型 研究 .仿真 模 
抠 等 方法 有 更 进一步 的 现实 意义 。 


与 情事 件数 据 进 行 归 一 化 处 理 ; 其 次 ,以 生命 周期 理论 
为 依据 划分 与 情 传播 周期 的 不 同 阶段 ;再 次 ,基于 LDA 
模型 进行 主题 挖掘 与 观点 识别 ;最 后 ,进行 词 频 统 计 ， 
并 与 前 述 的 主题 挖掘 结果 对 比 ,以 验证 本 研究 思路 与 
结论 。 具 体 的 研究 流程 及 设想 描述 如 下 : 

3.1.1 微 博文 本 数据 归 一 化 ” 微 博 中 的 异 构 数据 会 
直接 影响 到 主题 抽取 的 结果 ,那么 ,本 研究 先 要 解决 的 
就 是 微 博 异 构 数 据 归 一 化 ,即将 所 有 异 构 类 型 的 数据 
清理 ,统一 转换 成 规范 的 数据 格式 保存 ,以 为 主题 抽取 
和 语义 挖掘 做 基础 铺垫 。 归 一 化 的 方法 涉及 切 词 、 分 
词 . 停 用 词 过 滤 等 自然 语言 处 理 过 程 。 

3.1.2 基于 生命 周期 理论 的 奥 情 事件 传播 周期 阶段 
的 刻画 “与 情事 件 传播 生命 周期 反映 了 与 情 信 息 的 不 
同 发 展 阶 段 与 与 情 信息 的 生命 力 ,与 情 信 息 的 生命 力 


< 关于 生命 周期 理论 在 舆情 主题 中 的 研究 有 : 安 下 
等 利用 SOM 自 组 织 了 映射、 生命 周 期 理论 等 方法 ,通过 
世贸 预 处 理 .主题 分 类 等 步骤 ,对 Twitter 与 微 博 平台 
二 科 于 西非 埃 博 拉 病 毒 爆 发 的 热点 主题 进行 对 比分 
析 x 研 究 结论 发 现 了 主题 演化 模式 和 时 序 趋 势 的 异同 
2 。 陈 福 集 等 采用 了 话题 传播 演化 博弈 模型 ,通过 


借 监 “ 微 博 生 命 周 期 "理论 ,设计 了 基于 “ 微 博 关注 度 ” 
的 话题 多 元 信息 动态 更 新 机 制 5 。Q. Mei 等 采用 了 
一 神 新 的 概率 方法 来 构建 与 情 主题 研究 模型 ,并 且 结 
合生 命 周期 理论 ,通过 主题 生命 周期 的 划分 ,对 每 一 个 
给 写 的 时 间 段 主题 生成 快照 ,研究 结果 表明 所 构建 的 
研究 模型 能 够 适用 于 普遍 的 时 间 和 空间 信息 的 分 
析 ” 。 那 么 ,由 上 述 研究 的 特点 可 发 现 ,以 生命 周期 
传播 规律 理念 为 指导 的 研究 可 更 深入 、 细 致 地 挖 气 出 
与 情 主题 传播 规律 中 的 有 效 信息 和 结论 。 


LDA 模型 能 够 准确 清晰 地 表达 主题 中 隐藏 的 信 
息 ,而 生命 周期 理论 则 能 够 从 微观 上 展现 微 博 传播 主 
题 在 时 间 粒 下 的 变化 细节 、 特 征 、 特 点 等 。 由 此 ,本 文 
基于 LDA 与 生命 周期 理论 提出 本 文 的 研究 设计 ,设计 
中 包括 :研究 思路 与 流程 ,生命 周期 理论 的 划分 规则 、 
不 同 传播 者 的 热点 主题 模型 构建 3 个 环节 。 
3.1 研究 思路 与 流程 

为 实现 与 情 传播 周期 阶段 中 不 同 传播 者 的 热点 主 
题 挖 掘 与 观点 识别 ,研究 的 思路 设计 为 :首先 ,对 微 博 


又 反映 了 舆情 信息 所 含 内 容 的 传播 有 效 性 。 虽 然 在 与 
情 研 究 领域 中 ,由 于 分 析 案 例 的 传播 生命 周期 演变 具 
体 情 况 不 同 , 会 有 不 同 的 划分 结果 ,但 是 根据 生命 周期 
理论 ,一 般 性 事件 的 生命 周期 可 被 切 分 为 萌芽 期 .成 长 
期 .衰退 期 平稳 期 四 个 阶段 ,本 研究 将 以 这 四 个 阶段 
为 基础 制定 案例 研究 中 传播 周期 阶段 划分 的 规则 。 
3.1.3 基于 ILDA 模型 的 不 同 传播 者 的 主题 挖掘 与 观 
点 识别 ”本 研究 从 两 个 层次 对 传播 周期 各 个 窗口 期 的 
与 情 进 行 主 题 语义 挖掘 人 研究。 第 一 层次 :中 按照 生命 
周期 划分 的 不 同窗 口 期 对 语料库 实现 LDA 主题 抽取 ， 
根据 与 情事 件 各 阶段 抽取 的 特征 词 进 行 归纳 。@ 研 究 
结合 采集 的 语 料 语 境 对 归纳 的 特征 词 进行 主流 词组 的 
语义 标注 ,并 解读 传播 周期 各 阶段 语义 的 意义 。 第 二 
层次 :根据 标注 和 解读 的 语义 词组 ,对 传播 周期 各 阶段 
的 的 主题 进行 观点 识别 。 
3.1.4 词 频 统计 验证 应 用 相关 工具 或 软件 抽取 分 
析 语 料 的 高 频 词 ,去 除 噪音 .无 意义 的 词汇 ,并 进行 词 
频 高 低 的 排序 。 

根据 上 述 步 又 描述 的 内 容 , 本 文 提出 基于 不 同 传 
播 者 的 微 博 与 情 主 题 挖 据 与 观点 识别 的 研究 流程 设计 
见 图 1( 图 1 中 包含 了 本 文具 体 预 设 的 研究 方法 工具 
以 及 各 个 环节 的 关键 问题 ) 。 
3.2 ”基于 生命 周期 理论 的 微 博 传播 周期 阶段 划分 的 
规则 

在 生命 周期 理论 的 划分 中 ,通常 学 者 们 会 根据 具 
体 的 应 用 场景 划分 为 3 个 或 4 个 阶段 ,在 此 ,本 文 对 微 
博 与 情 传播 周期 进行 一 般 意 义 上 的 生命 周期 阶段 的 划 
分 ,并 提出 划分 规则 : 

(1) 萌 芽 期 : 微 博 与 情 发 文 、 评 论 量 较 少 , 传播 增 量 
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图 二 情 讼 


三 作 


第 62 卷 第 19 期 2018 年 10 月 


微 博文 本 数据 归 一 化 奥 情 传播 周期 划分 


le pe 词 


1 ”网 络 仆 虫 工 具 |! 1 a 
| 。 集 搜 窜 | | 号 苍 基 
| (GooSeeker) | | | | | 
a ' ee 
I 
| 一 进行 文本 预 处理 | 上 成 长 期 
1 


Se | we 1 
| | 构建 不 同 传播 者 | TECN 
Fr- 一 -| 1 IDA 实 验 语料库 | r--------- 
1 获取 、 分 类 不 同 || ““-----]------ 1 平稳 期 | 
| 传播 和 博文 本 数据 | | ! 
| 
| 


文 以 工 天 为 时 间 粒 度 , 将 与 情 
进行 生命 周期 阶段 的 划分 。 

(2) 微 博 用 户 维度 :用 户 是 
i | 熏 情 发 布 和 生产 的 主体 。 本 研 
“| 究 基 于 用 户 发 布 .用 户 评论 两 
个 层面 的 信息 源 进行 传播 主题 
的 挖 气 。 

(3 ) 微 博 内 容 维度 : 微 博 用 
户 的 发 布 .评论 信息 中 隐 含 着 
户 对 与 情事 件 的 情感 倾 
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图 1 研究 流程 设计 


/全 把 为 零 甚至 为 负增长 ,言语 匿 乏 单一 ,话题 种 类 较 少 ， 
但 也 煌 有 新 的 词语 出 现 ,表明 此 时 传播 情况 处 于 萌芽 期 。 
< 二 (2 ) 成 长 期 :新 浪 籁 博 呈 现 爆发 式 增长 ,出 现 指数 
增 抱 形式 ,发 文 . 评 论 量 呈 现 增长 状态 ,新 的 留言 .评论 
不 断 增 加 。 与 此 同时 ,与 情话 题 数量 激增 ,发 文 和 评论 
量 随 时 间 呈 现 激增 的 曲线 形式 说 明 传播 的 迅速 到 达 一 
作 吻 值 , 表 明了 与 情 传播 在 此 阶段 进入 了 超速 爆发 的 
院 几 ， 

〇 3) 衰退 期 :与 情事 件 发 文 .评论 量 呈 现 迅速 下 降 
趋 疗 ,传播 量 增长 率 递减 ,词语 增长 率 有 可 能 为 负 , 话 
题 数 基本 不 更 新 ,表明 该 阶段 与 情 传播 正在 退出 热门 
话题, 传播 量 明显 下 降 。 

己 (4) 平 稳 期 :与 情 事件 的 传播 在 经 过 衰退 期 以 后 ， 
每 隔 的 传播 量 进入 相对 稳定 的 时 期 。 该 阶段 传播 量 的 


度 的 内 容 。 
(4) 主题 挖掘 与 观点 识别 
维度 :基于 信息 采集 和 LDA 主 
题 抽取 获取 和 与 情 主题 ,并 将 隐藏 在 微 博 话语 中 的 主题 
进行 语义 标注 。 根 据 主题 的 语义 分 析 结 果 , 再 将 观点 

高 度 概 括 和 总 结 出 来 。 

然而 在 上 述 维度 的 描述 中 , 微 博 数据 仍然 存在 很 
多 特殊 性 :中 在 时 间 周 期 维度 层面 中 , 奥 情 事件 所 持 的 
主题 往往 在 很 短 的 时 间 内 就 发 生变 化 , 即 同一 阶段 内 ， 
出 现 多 个 主题 。@ 在 用 户 维度 层面 中 ,同一 用 户 可 能 
在 不 同 的 时 期 发 布 不 同 的 内 容 , 或 者 发 布 相似 的 内 容 。 
@ 在 内 容 维 度 层面 中 ,一 条 微 博 内 容 可 能 表达 了 几 种 
观点 ,也 有 可 能 是 几 条 微 博 都 属于 同一 类 观点 。 所 以 ， 
研究 根据 微 博 数据 的 特征 和 特殊 性 ,构建 由 时 间 周 期 、 
微 博 用 户 、 内 容 三 个 维度 因素 融合 影响 下 的 主题 挖掘 
模型 ,主题 挖掘 与 观点 识别 的 维度 视 为 这 三 个 因素 作 


增 蛤 率 几 平 为 零 ,并 且 传 播 能 量 经 过 萌芽 期 .成 长 期 、 
衰退 期 后 ,已 经 进入 了 传播 群体 情感 宣泄 ,思想 表达 的 
消极 期 。 然 而 ,此 时 的 传播 情况 还 可 能 会 出 现 两 种 趋 
势 ,一 是 该 主题 传播 量 递减 ,没有 新 的 语言 动向 ,传播 
量 维持 在 一 定 的 稳定 水 平 。 二 是 在 原 有 主题 的 基础 
上 ,由 于 新 闻 消 息 的 披露 ,一 些 词语 量 呈 正 增长 趋势 ， 
和 与 情 信息 传播 量 有 所 递增 。 表 明 该 事件 衍生 出 了 新 的 
热点 话题 ,新 的 与 情 也 即将 爆发 。 


构建 
根据 划分 的 传播 周期 ,本 文 结合 LDA 主题 模型 构 
建 微 博 熏 情 事件 环境 下 的 热点 主题 研究 模型 。 构 建 模 
型 的 主要 维度 有 :时 间 周 期 微 博 用 户 \ 微 博 内 容 、 主 题 
挖掘 与 观点 识别 ,维度 描述 如 下 : 
(1) 时 间 周 期 维度 :和 与 情事 件 的 传播 是 由 时 间 流 
和 信息 组 成 。 根 据 与 情 信 息 传播 周期 的 发 展 趋势 ,本 
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的 结果 ,研究 模型 见 图 2。 本 文 力求 构建 不 同 传播 
者 的 热点 主题 研究 模型 能 够 反映 出 与 情 传 播 的 势 态 ， 
同时 能 为 自 情 管理 控制 的 实时 监测 和 危机 应 对 提供 有 
参考 价值 的 结论 。 


4 实证 分 析 
4.1 研究 数据 采集 与 处 理 
4.1.1 数据 采集 及 基本 情况 描述 本 研究 利用 网 络 
疏 虫 工具 集 搜 客 GooSeeker 对 “8. 12 天 津 爆炸 事件 ” 进 
行 数据 采集 。 研 究 抓 取 数 据 包括 : 微 博 发 布 内 容 、 微 博 
评论 内 容 、 微 博 发 布 者 DD 、 微 博 评 论 者 上 D、 微 博 ID 等 。 
采集 时 间 为 2015 年 8 月 12 日 到 2015 年 9 月 13 日 。 
图 3 是 统计 的 采集 微 博 发 布 和 评论 数据 总 的 传播 量 趋 
势 。 

根据 “8. 12 天 津 爆炸 事件 ”传播 量 趋势 ,本 文 对 所 
研究 的 与 情 案例 进行 与 情 传播 周期 的 切 分， 周期 分 为 


el 


es i 甘 日 二 | 
麻 海 消 ， 王 自净 ， 关 鸯 .机 博 典 情 桂 括 膨 期 中 不 同 传 揪 才 的 主题 挡 所 与 观 直 识 刘 [1]. 图书 情报 全 风 史 入 俯 期 乔 
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评论 者 B 
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图 2 不 同 传播 者 的 热点 主题 研究 模型 
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具 s00 博 所 表达 的 观点 .语义 结合 博文 本 内 容 进 行 总 结 、 归 
000 vy 和 了 加 -HH 、\ 五 业 \ 
类 ,在 进行 人 工 噪音 处 理 后 建立 了 规范 的 基础 语料库 。 
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人 SR 
© 时 间 
CN 图 3 “8.12 天 津 爆炸 事件 "每 日 传播 量 


3 12 日 到 8 月 15 日 ) 爆发 期 (8 
月 Kt6 日 到 8 月 31 日)、 平 稳 期 (9 月 1 日 到 9 月 13 
日 所 在 划分 阶段 中 ,8 月 16 日 当日 传播 量 出 现 激增 ， 
并 齿 到 达 了 传播 的 最 高 峰值 ,是 成 长 期 显著 的 传播 特 
征 流 8 月 17 日 到 31 日 ,传播 总 量 呈 现 迅 速 下 降 的 训 
退 趋势 ,是 衰退 期 显著 的 传播 特征 ; 由 于 在 与 情 传播 
中 ,这 两 种 传播 态势 都 存在 于 事件 的 发 酵 高 温 期 ,如 果 
分 阶段 计量 分 析 , 不 利于 主题 的 控 气 ,所 以 将 两 个 阶段 
合并 定义 为 爆发 阶段 。 其 余 阶 段 的 传播 趋势 均 符合 与 
情 生命 周期 的 划分 规则 。 

4.1.2 文本 处 理 实验 步骤 ”根据 微 博信 息 发 布 性 质 
的 不 同 ,研究 将 传播 者 定义 为 微 博 发 布 者 和 微 博 评论 
者 。 微 博 发 布 者 包括 官 媒 、 大 众 媒体 等 公共 媒体 , 微 博 
评论 者 包括 多 数 普通 用 户 等 信息 接收 者 。 针 对 不 同类 
型 的 传播 者 ,研究 建立 两 类 语料库 , 即 微 博 发 布 者 语 料 
库 和 微 博 评 论 者 语料库 。 根 据 研究 的 需求 ,本 文选 择 
了 微 博 发 布 的 长 博文 和 用 户 的 短评 论 作为 初始 的 语 
料 。 由 于 采集 的 “8. 12 天 津 爆炸 "事件 的 微 博文 本 中 
黑 话 , 病 话 .片段 话语 、 谣 言 随处 可 见 , 这 些 词汇 表达 激 


化 的 数据 ,以 此 作为 实验 所 用 的 语 料 。 然 后 ,再 基于 开 
源 gensim 包 实 现 LDA 主题 模型 的 参数 训练 。 本 研究 
的 LDA 参数 设置 参考 了 相关 文献 的 方法 ,设置 迭代 
次 数 为 2 000 次 , 超 参 数 设置 a =0.01,8 =0.05, = 
10。 参 数值 确定 后 ,输入 语 料 文件 ,运行 LDA 建 模 程 
序 。LDA 主题 抽取 后 获得 两 个 重要 结果 文档 。 一 个 
是 主题 分 布 文档 ,该 文档 用 来 计算 主题 强度 ; 另 一 个 
是 特征 词 分 布 文档 ,是 每 个 主题 下 的 特征 分 布 的 词 


项 及 概率 。 
4.1.3 主题 抽取 结果 展示 “研究 分 别 对 两 个 实验 语 


料 库 进 行 萌芽 期 爆发 期 平稳 期 的 LDA 主题 抽取 ,得 
出 每 个 阶段 的 10 个 抽取 主题 及 该 主题 下 的 相关 词 项 。 
由 于 篇 幅 限制 ,本 文选 取 了 抽取 的 部 分 主题 文档 作为 
结果 展示 , 见 表 1 和 表 2。 
4.2 ” 微 博 与 情 传播 周期 中 不 同 传播 者 的 主题 语义 
安 掘 

为 了 更 准确 地 挖掘 、 解 读 主 题 语义 ,本 研究 选取 传 
播 周 期 各 阶段 强度 前 三 的 热点 主题 进行 分 析 , 且 择优 
选取 热点 主题 下 概率 较 高 的 十 项 特征 词 进行 主题 解 
读 。 那 么 ,热点 主题 特征 词 归 纳 结果 见 表 3。 

根据 以 上 表 3 ,本 文 结合 语料库 对 特征 词 进行 主 
流 语 义 的 标注 ,以 得 到 各 阶段 热点 主题 的 关键 词组 , 结 
果 见 表 4。 
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表 1 萌芽 期 微 博 发 布 者 主题 抽取 结果 


Topicl Topic2 Topic3 Topic4 
0. 009 885 公司 0.011 977 机 构 0.008 522 居民 0.008 157 现场 
0.008 627 现场 0.011 897 事故 0.008 478 距离 0.008 157 事故 
0.007 285 企业 0.011 602 全 面 0. 008 395 悲剧 0. 008 157 消息 
0.006 804 人 员 0.011 266 物品 0. 008 300 发 生 爆 炸 0.008 157 发 生 爆 炸 
0. 006 727 事故 0.010 929 范围 0.008 258 蜗 定 0.008 157 码头 
0.006 326 地 点 0.010 786 产品 0. 008 195 信息 , 0.008 157 冲击 波 
0.006 313 发 生 爆 炸 0.010 538 公司 0. 008 169 规划 0.008 157 感觉 
0.006 160 物流 0.007 659 标准 0.008 162 居民 区 0.005 447 集装箱 
0.006 050 仓库 0. 007 659 居民 0.008 155 上 时间 0.005 447 医院 
0. 006 046 港 0.007 659 平均 价格 0.008 150 区 域 0.005 447 仓库 
表 2 萌芽 期 微 博 评论 者 主题 抽取 结果 
Topicl Topic2 Topic3 Topic4 

0.001 367 朋友 图 0.001 965 逝 者 0.001 130 少女 0.001 879 朋友 
-0.001 356 照片 0.001 821 感觉 0.001 124 谣言 0.001 857 消防 员 
-0. 001 352 可 家 0.001 750 户 0.001 116 部 队 0.001 802 现场 
j0. 001 326 少女 0.001 718 灾难 0.001 115 化 学 0.001 781 学 校 
-0.001 313 孩子 0.001 635 医院 0.001 108 人 数 0.001 760 评论 
001 302 国际 0.001 628 卫视 0.001 104 人 祝 0.001 750 谣言 
001 298 消防 员 0.001 558 家 人 0.001 104 小 心 0.001 740 事故 
001 284 老百姓 0.001 544 回 家 0.001 095 仓库 0.001 715 事情 
.001 276 新 闻 0.001 511 新 闻 0.001 076 舍 息 0.001 690 名 字 
\0. 001 268 同学 0.001 461 舍 息 0.001 039 灾难 0.001 669 同胞 


表 3 微 博 与 情 传播 周期 各 阶段 热点 主题 特征 词 


传播 阶段 热点 主题 特征 词 


萌芽 其 Topic(5.97) :现场 (0.008 627) 人 员 (0.006 805) 事故 (0.006 727) 地 点 (0.006 326) 爆炸 (0.006 312) 物流 (0.006 16) 


仓库 (0.006 05) 港口 (0.006 046) 负责 人 (0.005 776) 集装箱 (0.005 764) 


爆发 期 Topic(4. 82) :行业 (0.009 15) 部 门 (0.007 622) 有 限 公司 (0.007 564) 规定 (0.007 553) 企 业 (0.006 909) 危 化 品 (0.006 
88) 依法 (0.006 514) 专 案 组 (0.006 031) 立 案 侦 查 (0. 006 031) 公安 机 关 (0.006 031) 强制 措施 (0.006 031) 


平稳 期 Topic(1.001) : 事态 (0.00623) 保险 公司 (0.006189) 隐 性 (0.006) 巨头 (0.005 978) 根本 性 (0.005 953) 专业 化 (0.005 
946) 爆炸 (0.005 923) 航运 (0.005 918) 进出 港 (0.005 888) 制造 商 (0.005 845) 


微 博 评论 者 萌芽 期 Topic(7. 63 ) :事故 (0.002 624) 评论 (0. 002 368) 医院 (0.002 096) 视频 (0.002 078) 消息 (0.001 984) 新 闻 (0.001 945 ) 
消防 (0.001 842) 事情 (0. 001 788) 关心 (0.001 769 ) 能 量 (0. 001 765 ) 世 菇 云 (0.001 758) 


爆发 期 Topic (6.008) :灾难 (0.001 588) 责任 (0.001 479) 战 士 (0.001 473) 买单 (0.001 466) 事 件 (0.001 437) 心痛 (0.001 433) 
社会 (0.001 404) 交代 (0.001 4) 百姓 (0.001 391) 消防 员 (0.001 372) 


平稳 期 Topic(3.55) : 群众 (0.003 069) 记 者 (0.003 042) 法 律 (0.002 99) 力度 (0.002 978) 民众 (0.002 969) 企业 (0.002 958) 
政府 (0.002 953) 老百姓 (0. 002 945 ) 制裁 (0. 002 945) 时 间 (0. 002 913) 


表 4 微 博 与 情 传播 周期 各 阶段 热点 主题 的 关键 词组 
。 微 贿 发 布 者 。。 萌芽 期 。。 Topic: 现 场 火光 受伤 人 员 天 津 保 炸 事故 爆炸 地 点 瑞 海 物流 危险 品 仓库 港口 管理 企业 负责 人 集装箱 内 易 燃 易 爆 物品 


爆发 期 Topic: 化 工行 业 安 监 部 门 瑞 海 国际 物流 有 限 公司 安全 距离 规定 危 化 品 经 营 企业 依法 追究 检察 调查 专案 组 立案 侦查 
天 津 公安 机 关 采取 强制 措施 


稳 期 Topic :跟踪 事态 保险 公司 赔偿 隐 性 影响 化 工 巨 头 治理 体系 根本 性 专业 化 治理 天 津 爆炸 航运 公司 停止 进出 港 汽车 制 
造 商 
微 博 评论 者 萌芽 期 Topic :爆炸 事故 写 评论 送 往 医院 看 视频 官方 消息 刷新 闻 消防 人 员 这 种 事情 正 能 量 看 见 蘑菇 云 


爆发 期 Topic :灾难 面前 承担 责任 英雄 战士 来 买单 爆炸 事件 太 心 痛 社会 责任 给 交代 百姓 们 为 消防 员 祈 福 
平稳 期 Topic :受灾 群众 新 闻 记者 法 律 制裁 安全 监管 力度 天 津 民众 大 企业 相信 政府 保障 老百姓 第 一 时 间 
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(1) 不 同 传播 者 的 语言 特征 解读 。 观 察 表 4 整体 
内 容 , 发 现 微 博 发 布 者 语言 较为 正规 化 .专业 化 多 使 
用 陈述 性 的 名 词 ,如 :“ 人 危险 品 仓库 ”“ 安 全 距离 规定 ” 
“立案 侦查 ”“ 治 理 体系 根本 性 "等; 微 博 评 论 者 语言 较 


4.3 基于 主题 挖掘 结果 的 不 同 传播 者 的 热点 主题 观 
点 识别 


本 文 根 据 主题 按 气 结 果 ,结合 微 博 语 料 的 具体 语 
境 选 出 代表 性 微 博 ,并 进一步 进行 人 工 识别 和 主题 观 


为 日 常 化 口语 化 多 使 用 动词 ,如 :“ 写 评论 "“ 刷 消 点 的 总 结 。 下 图 4 是 本 文 整理 的 每 阶段 传播 的 热点 主 
息 ”看 见 蘑菇 云 "等 。 题 观点 及 传播 演化 情况 : 
(2) 不 同 传播 者 传播 周期 各 阶段 
主题 语义 分 析 。 在 微 博 发 布 者 主题 控 事 放 所 
据 方面 :@D 萌 芽 期 中 , 微 博 发 布 的 热点 “| 全 中奖 和 者 4 
主题 是 “事故 报道 ”, 该 主题 包含 了 与 ee 2 
热 议 事故 相关 的 主要 信息 ,如 集装箱 、 现场 场景 描述 
A 十 2. 事 件 相关 信息 
危险 品 仓库 等 ;以 及 与 事故 相关 的 关 3 事件 相关 人 物 
月 二 hr 时 二 1. 心痛 悲哀 2. 经 
键 人 物 ,如 企业 负责 人 、 受 伤 人 员 O © | | 2. 至 区 英雄 3 二 
爆发 期 中 , 微 博 发 布 的 话题 与 前 一 阶 “| 八 iFie 者 了 人 
4 相 上 先 能 事件 讨论 
段 本 比 有 了 转换 。 由 原先 的 事故 相关 | a 
储 司 的 发 布 .报道 ,转变 成 了 “事故 追 2 控 计 事件 名 方面， 1 相信 政府 
全 、 、 抢救 情况 、 现场 浓 2. 法 律 制裁 结果 
似 们 新 的 热点 主题 体现 了 发 布 者 对 烟 、 消 防 训 二 3 保障 百姓 


开 王 信息 的 深度 过 握 。 从 该 主题 下 的 
关键 词组 组 成 的 逻辑 可 以 看 出 ,信息 
据 议 了 企业 爆炸 出 现 的 原因 ,如 违 彰 
E 
睛 王 息 。 加 平稳 期 中 , 微 博 发 布 的 热点 主题 是 “灾后 盘 
虞 由 关键 词组 可 以 看 出 ,内 容 涉及 经 济 赔偿 .损失 的 
盘 豪 以 及 提出 企业 经 营 管理 问题 的 治理 要 求 。 

> 在 微 博 评论 者 主题 挖掘 方面:D 萌 芽 期 中 , 微 博 用 
户 涪 沦 的 热点 主题 是 “事故 讨论 " ,从 该 主题 可 以 了 解 
到 萌芽 阶段 用 户 通过 剧 新 闻 ,看 视频 等 方式 接收 消息 ; 


平稳 期 


基于 以 上 图 4 发 现 ,在 事件 传播 的 过 程 中 , 微 博 发 
布 者 和 微 博 评论 者 的 传播 话题 的 主题 观点 各 有 特征 和 
员 向 ;同时 ,图 4 也 展示 了 本 研究 与 情事 件 传播 主题 的 
结构 和 脉络 。 如 微 博 发 布 方面 主题 谈论 的 是 “事故 报 
道 “ 事 故 追 查 ”“ 灾 后 盘点 ”, 而 用 户 评论 方面 则 谈论 
的 是 “事件 讨论 “情绪 表达 “灾后 安排 。 由 传播 周 
期 主题 演化 脉络 可 以 看 出 ,研究 基于 案例 挖掘 出 的 热 


jn 


用 吧 还 探讨 了 医疗 情况 . 浓 烟 势 态 .并 呼吁 正 能 量 言 
论 。@ 爆 发 期 中 , 微 博 用 户 评论 的 热点 主题 是 “事故 情 
感 ” ,该 主题 下 的 来 买单 、 太 心痛 ,给 交代 ,祈福 等 词 者 
表征 了 用 户 在 该 时 间 段 的 悲痛 .气愤 .无奈 等 的 情感 和 
追求 真相 的 心理 状态 。@ 平 稳 期 中 , 微 博 用 户 评论 的 
热点 主题 是 “灾后 安排 ”, 该 主题 的 关键 词组 中 出 现 的 
相信 政府 .保障 百姓 .安全 监管 等 词汇 ,说 明了 老百姓 
相信 政府 会 出 台 有 效 措施 、 政 策 安排 灾后 民众 的 民生 
问题 ,以 及 关注 对 事故 责任 人 的 法 律 制裁 的 心理 诉求 。 

由 以 上 分 析 可 知 , 微 博 发 布 者 与 评论 者 的 萌芽 期 
热点 主题 分 别 为 “事故 报道 ”与 “事故 讨论 ” ,爆发 期 分 别 
为 “事故 追查 "和 “事故 情感 ” ,平稳 期 分 别 为 “灾后 盘 
点 "和 “灾后 安排 ”。 各 阶段 主题 对 比 发 现 ,政府 官方 新 
闻 媒体 发 布 的 内 容 基本 上 属于 事件 消息 的 披露 ,用 户 发 
布 的 内 容 基本 上 是 表达 观点 .情感 和 心理 诉求 等 , 且 微 
博 发 布 者 主题 和 评论 者 主题 具有 较 大 的 差异 性 。 


ul 


点 主题 符合 事件 发 展 的 逻辑 ,和 发 布 评论 对 象 的 说 话 
人 逻辑。 由 此 ,说 明了 本 文 提出 的 结合 生命 周期 理论 和 
LDA 模型 的 与 情事 件 热点 主题 分 析 系 统 具 有 科学 性 和 
有 效 性 。 
4.4 研究 结果 的 验证 

为 了 对 主题 挖掘 结论 的 有 效 性 以 及 基于 LDA 和 
生命 周期 组 合 的 主题 分 析 体系 的 可 靠 性 进行 验证 ,本 
研究 以 词 频 秩序 分 析 法 统计 了 “8. 12 天 津 爆炸 ”事件 
传播 周期 中 的 与 情 内 容 Top10 的 高 频 词 和 词 频 ,统计 
结果 见 表 5。 

由 表 5 可 知 , 微 博 与 情 传 播 周 期 Top10 高 频 关键 
词 代 表 了 全 局 和 每 个 阶段 的 10 个 研究 主题 , 即 研 究 主 
题 从 单个 关键 词 来 定义 。 如 全 局 高 频 关键 词 中 ,“ 爆 
炸 ” 这 个 关键 词 出 现 了 417 次 ,说 明 “ 爆 炸 ” 是 最 受 关 
注 的 主题 ,但 该 主题 下 所 包含 的 深层 次 的 语义 信息 无 
法 得 知 ,而 LDA 方法 所 得 到 的 结果 是 一 个 主题 以 及 该 


| 
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表 5 微 博 和 与 情 传播 周期 Top10 高 频 词 


全 局 萌芽 期 爆发 期 平稳 期 

微 博 发 布 者 微 博 评 论 者 微 博 发 布 者 微 博 评论 者 微 博 发 布 者 微 博 评 论 者 微 博 发 布 者 微 博 评论 者 
爆炸 417 新 闻 64 爆炸 185 新 闻 33 天 津 160 社会 22 爆炸 101 老百姓 10 
天 津 367 逝 者 61 天 津 124 逝 者 29 爆炸 131 灾难 22 天 津 83 社会 10 
事故 247 感觉 59 事故 84 视频 28 滨海 117 消防 员 22 事故 48 灾难 10 
滨海 199 事故 58 现场 82 消息 28 事故 115 责任 22 天 津 港 40 政府 10 
安全 182 灾难 57 安全 78 朋友 27 安全 101 消防 员 22 新 区 39 爆炸 事件 9 

天 津 港 156 事情 56 消防 62 感觉 27 天 津 港 78 时 间 22 滨海 37 新 闻 9 
新 区 138 评论 55 人 员 54 医院 27 企业 61 新 闻 22 业主 33 企业 9 
现场 135 消防 员 54 距离 52 事故 27 新 区 60 交代 22 居民 23 责任 人 8 
企业 114 地 方 54 危险 47 仓库 26 天 津 市 55 事故 22 损失 23 牺牲 者 8 
消防 112 国家 54 滨海 45 消防 24 房屋 43 问 责 21 天 津 市 22 制裁 8 


主题 下 相关 词 项 。 将 表 5 与 抽取 的 主题 关键 词 结果 表 
进行 对 照 分 析 , 从 表 5 中 的 全 局 高 频 词 列 可 以 看 出 , 微 
博 发 布 者 和 评论 者 抽取 的 主题 词 基本 涵盖 高 频 词 ,这 
表征 基于 LDA 抽取 的 词 项 具有 准确 性 。 

| 在 通过 同样 的 方法 观察 对 比 各 阶段 高 频 关键 词 的 


台中 公众 用 户 孕 育 出 了 自己 的 个 性 话题 。 而 生命 周期 
理论 ,是 针对 于 传播 主题 的 刻画 ,达到 了 展现 宏观 事态 
结构 的 功能 ;再 从 微观 方面 来 讲 , 本 文 挖掘 出 了 时 间 粒 
度 下 的 主题 内 容 及 相关 信息 ,并 展示 出 每 阶段 的 影响 
力 话题 ,深化 了 社会 与 情 研究 ,为 决策 提供 更 多 的 信 


结 卉 ,如 见 表 5 的 第 三 列 代表 的 是 萌芽 阶段 微 博 发 布 
才 罗 高 频 词 , 以 及 表 1 萌芽 期 微 博 发 布 者 主题 抽取 的 
结 更 。 对 比 可 知 ,LDA 的 特征 词 也 基本 涵盖 了 高 频 词 
上 3 表 5 中 的 第 五 列 关键 词 显 示 : 天津. 企业 .新 区 、 天 
让, 房屋 等 高 频 词 ,研究 发 现 这 些 高 频 词 之 间 的 语义 
意境 跨度 较 大 , 词 项 间 的 关系 无 从 得 知 ,按照 频次 高 低 
排列 在 一 起 也 很 难 识别 出 语义 信息 。 而 LDA 得 出 的 
主题 抽取 结果 ,如 表 3 中 微 博 发 布 者 萌芽 阶段 显示 的 
现场 .人 员 事故 .地 点 .爆炸 物流 ,仓库 ,港口 等 词 是 
包 痊 在 “事故 报道 "这 个 主题 下 的 特征 词 , 而 这 些 词 项 
的 秘 合 也 体现 出 了 该 主题 的 意义 ,并 且 由 LDA 的 特征 
词 硕 还 可 以 看 出 ,LDA 抽取 的 结果 能 够 读 取 的 信息 不 
仅 具体 且 更 为 丰 


本 研究 以 微 博 “8. 12 天 津 爆炸 事件 "为 例 ,对 不 同 
传播 者 的 发 表 内 容 进行 LDA 模型 和 生命 周期 理论 结 
合 的 主题 挖掘 与 观点 识别 分 析 。 研 究 得 出 了 一 些 有 意 
义 的 结论 ,总 结 如 下 : 

在 理论 意义 方面 ,本 文 将 LDA 模型 和 生命 周期 理 
论 结合 ,实现 了 方法 论 与 理论 的 融合 应 用 。 将 构建 的 
LDA 热点 主题 挖掘 模型 ,应 用 到 特定 事件 的 案例 中 , 通 
过 挖掘 模型 的 维度 分 析 、 层 次 分 析 、 角 色 分 析 , 研 判 出 
分 布 在 传播 当中 有 关联 性 的 、 代 表 性 的 、 重 要 的 词语 ， 
以 及 不 同 传播 者 热点 主题 的 异同 ,大 大 提高 语 料 信息 
的 解释 性 。 但 由 总 体 的 主题 分 析 而 言 , 政 府 官 媒 、 大 众 
媒体 和 用 户 群 体 话题 有 着 显著 的 差异 性 ,显然 微 博 平 


A 
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息 。 在 现实 意义 方面 ,本 文具 有 实时 监测 的 意义 。 本 
文 识别 出 的 主题 观点 ,能 够 了 解 与 情势 态 变迁 .演化 过 
程 .公众 的 思想 观念 转变 等 情况 ,上 且 本 文 借助 生命 周期 
的 划分 观察 ,起 到 了 奥 情 监测 的 目的 。 

然而 ,本 文 的 研究 仍然 是 有 一 定 的 局 限 和 困境 的 。 
本 文 建 立 的 研究 模型 ,能 够 有 效 的 挖掘 舆情 传播 周期 
的 热点 主题 ,但 方法 仍 有 竺 改进。LDA 主题 模型 抽取 
的 特征 词 也 不 能 像 人 工 那 样 完整 的 解读 一 句 话 的 意 
义 , 能 够 挖掘 的 结论 仅 限 于 在 集中 词 项 聚 类 下 表达 的 
主题 的 意义 ,这 也 是 LDA 方法 解读 文本 的 局 限 性 。 
此 ,如 何 挖掘 出 言论 中 更 多 的 有 效 信息 , 仍 是 需要 进 一 
步 解 决 的 问题 。 在 未 来 研究 的 发 展 方向 上 ,本 文 考虑 
奥 情 传播 主题 与 主题 ,主题 与 事件 .主题 与 媒介 、 应 用 
情境 等 元 素 之 间 的 关联 ;在 研究 方法 上 ,加 强 和 深化 定 
性 分 析 ,使 得 研究 更 加 具有 社会 科学 性 ;同时 也 力求 未 
来 的 研究 通过 这 些 新 增 视 角 元素 .方法 等 能 够 更 加 深 
人 地 刻画 奥 情 事件 隐藏 主题 的 遗 佟 和 变异 ,也 更 加 清 
晰 地 展现 事件 发 展 的 脉络 和 趋势 。 那 么 ,如 何 从 主题 
关联 视角 进行 与 情事 件 的 语义 挖掘 ,将 是 今后 研究 需 
要 进行 的 重点 。 
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Topic Mining and Viewpoint Recognition of Different Communicators in the 
Transmission Cycle of Micro -blog Public Opinion 
Liao Haihan: Wang Yuefen:” Guan Peng 

! School of economics and management, Nanjing University of Science and Technology, Nanjing 210094 
? Social Public Safety Science and Technology Co -Innovation Center, Jiang Su Province, Nanjing 210094 

Abstract: [Purpose/significance | This paper aims to explore the hot spot of public opinion and the main point view 
of the communication of different communicators in the transmission cycle of micro-blog public opinion and to discover the 
characteristics and laws of public opinion transmission ，which can provide the basis for public opinion analysis and deci- 
sion making. [Method/process | This study is based on the text data of a true public opinion event. It adopted life cycle 
theory and LDA method to design research process and construct research model and researched topics of different com- 
municators in micro-blog public opinion events, including topic extraction and semantic annotation, semantic analysis of 
different communicators at various stages, recognition and characterization of theme views of public opinion based on time 
dimension. [ Result/conclusion | It is found that the research model proposed in this paper can excavate topic theme 
structure, view and characteristics of different communicators in the communication cycle of public opinion. And the words 
with actual meaning and irritating function are related, representative and important. At the same time, the conclusion al- 
so found a hot topic in the mass media or the official micro -blog is totally different from micro -blog users. 
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